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Abstract 


Air pollution is one of the most harmful natural hazards in Tehran metropolitan. Particles with a 
diameter of less than 2.5 micrometers (PM2.5) as one of the most harmful pollutants have 
endangered the health of people living in Tehran. One of the PM2.5 estimation techniques is the 
use of Aerosol Optical Depth (AOD) products derived from satellite observations. Various AOD 
products are retrieved with different algorithms that do not have the same accuracy and spatial 
resolution. Due to the differences in many assumptions and approximations adopted in the AOD 
retrieval process, the generated AOD products involve uncertainties. This issue reduces the 
accuracy of PM2.5 concentration estimation. The purpose of this study was to investigate the 
possibility of fusing AOD products obtained from MODIS sensor observations (retrieved by Deep 
Blue and Dark Target algorithms) to estimate PM2.5 more accurately. First, the performance of 
different machine learning algorithms in estimating PM2.5 from AOD data was evaluated. As a 
result, the XGBoost algorithm with the highest performance was selected as the base model for 
PM2.5 estimation. Then, the AOD products were fused using a weighted averaging based on the 
retrieval quality of the primary products. Finally, the fused AOD product along with 
meteorological data were employed to estimate PM2.5 using XGboost. The results demonstrated 
that the accuracy of PM2.5 estimation from the fused AOD product is better than when the AOD 


products are used individually (R?= 0.77, MAE = 7.00 = RMSE = 9.59 =D, Thus, the retrieval 
quality of AOD products will lead to more accurate estimation of PM2.5 in the end. 


Keywords: Aerosol Optical Depth, Data Fusion, MODIS, PM2.5, XGBoost 


*. Corresponding author: Hossein Bagheri Email: h.bagheri @cet.ui.ac.ir Tel:+989 127567529 
How to cite this Article: Mirzaei, A., Bagheri, H., & Sattar, M. (2023). Estimation of PM2.5, as a 
harmful environmental hazard in Tehran by fusion of MODIS aerosol products through a machine 
learning approach. Journal of Geography and Environmental Hazards, 12(3), 101-122 
DOI: 10.22067/geoeh.2023.79402.1296 
Journal of Geography and Environmental Hazards are fully compliant 
6 0 With open access mandates, by publishing its articles under Creative 
BY Commons Attribution 4.0 International License (CC BY 4.0). 


ایرانی ژئومورن 
رجهت م دو 


Creative Commons Attribution 4.0 Intemational License (CC BY 4.0) 


Geography and Environmental Hazards 
Volume 12, Issue 3 - Number 47, Fall 2023 
https://geoeh.um.ac.ir 
a) https://doi.org/10.22067/geoeh.2023.79402.1296 


<< 


Bp a: dee 
وا روک تن‎ 


جغرافیا و مخاطرات محیطی. سال دوازدهم. شمارة چهل و هفتم. پاییز ۱۶۰۲ صص ۱۰۱-۱۲۲ 


مقاله پژوهشی 


ارائه یک روش مبتنی بر یادگیری ماشین برای تلفیق محصولات آثروسل سنجندة مادیس جهت بهبود 


تخمین ۳۷۲2.5 به‌عنوان یکی از مهم ترین مخاطرات زیست‌محیطی در شهر تهران 


على میرزایی -کارشناسی ارشد دانشكدة مهندسی عمران و حمل‌ونقل. دانشگاه اصفهان اصفهان ایران 
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حکده 


افزايش بحران‌های محیط‌زیست در جهان باعث شده است تا در دهه‌های اخیر اهمیت مطالعه در مورد 
مسائل زیست‌محیطی افزايش يابد. آلودگی هوا در ردیف یکی از زیان‌بارترین مخاطرات طبیعی قرار گرفته 
است. ذرات Glee‏ در هوا با قطر کمتر از ۲.۵ میکرومتر (PM2.5)‏ یکی از حطرناک‌ترین و مضرترین نوع 
ذرات در ميان آلاینده‌های مختلف هوا برای سلامتی انسان هستند. یکی از تکنیک‌های تخمین ۷2.5( 
استفاده از محصولات عمق نوری آثروسل (AOD)‏ است. محصولات مختلف AOD‏ با الگوریتم‌های 
متفاوتی بازیابی می‌شوند که دارای دقت و قدرت تفکیک مکانی یکسانی نمی‌باشند. به دلیل تفاوت در 
فرضیات و تقریبات زیادی که در مراحل بازیابی AOD‏ ها اتخاذ می‌شود. محصولات tJ AOD‏ شده 
دارای عدم قطعیت هستند. اين موضوع. باعث کاهش دقت تخمین غلظت 2012.5 می‌گردد. هدف اين 
مقاله بررسی امکان Gal‏ محصولات AOD‏ حاصل از مشاهدات سنجندة MODIS‏ (بازیابی شده توسط 
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میرزایی, علی, باقری, حسين, ستاری, مهران. (۱1۰۲). ارائه یک روش مبتنی بر یادگیری ماشین برای تلفیق محصولات آثروسل 
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۱۰۲ جغرافیا و مخاطرات محيطى شمارة سوم 


الگوریتم‌های Deep Blue‏ و (Dark Target‏ به‌منظور تخمین دقیق‌تر ۴12.5 است. در اين مطالعه 
نخست با انجام آزمایش بر روی الگوریتم‌های مختلف یادگیری ماشین و بررسی عملکرد آن‌ها در تخمین 
5 از روی‌داده‌های AOD‏ الگوریتم XGBoost‏ به‌عنوان الگوریتم پایه در روش تلفیق پیشنهادی 
انتخاب شد. سپس محصول AOD‏ تلفیقی با استفاده از یک روش وزن‌دهی مبتنی بر کیفیت بازیابی 
محصولات اولیه. تولید شد. محصول تلفیقی به همراه داده‌های هواشناسی و الگوریتم XGBoost‏ برای 
تخمین 512.5 مورد استفاده قرار گرفت. نتایج حاصل از تلفیق نشان داد که دقت تخمین PM2.5‏ 


محصول تلفیقی در هر سه شاخحص R? MAE RMSE‏ نسبت به حالت‌هایی که محصولات به‌صورت 


ug 
m3 ‘ 


منفرد استفاده شدند بهتر است MAE = ۷.۰۰ EF 8 =W)‏ ج (RMSE=4.04‏ علاوه بر افزايش 
دقت. روش پیشنهادی ساده و از نظر محاسباتی کم‌هزینه است. علاوه بر اين در اين تحقیق مشخص 
گردیده توجه به نشانگو phil AS‏ محصولات tins AOD‏ دستیایی به یک محصول Pads ABT‏ 
را فراهم خواهد کرد. 

کلیدواژه‌ها: عمق نوری آئروسل» Gat‏ داده. سنجندة MODIS‏ ۷۲2.5( الگوریتم XGBoost‏ 


۱- مقدمه 


امروزه آلودگی هوا به یکی از مهم‌ترین مخاطرات زیست‌محیطی تبدیل شده است )2018 (Huang & Kuo,‏ 
رشد جمعیت شهرنشین توسعة صنعت. افزايش ترافیک و عدم برنامه‌ریزی مناسب در زمينة JES‏ منابع آلودگی هوا 
ازجمله عواملی هستند كه منجر به افزايش انتشار آلاینده‌ها و تشدید اين مشکل شده‌اند. از مهم‌ترین اين آلاینده‌هاء 
ذرات (PM) gles‏ هستند )2020 (Luo et al.,‏ در دهه‌های اخير علاوه بر منابع طبیعی (مثل آتشفشان‌هاء آتش‌سوزی 
و طوفان‌های گردوخاک» افزايش منابع غیرطبیعی مانند استفاد زياد از سوخت‌های فسیلی در بخش‌های صنعتی و 
حمل‌ونقل نیز انتشار ذرات Glee‏ را تشدید کرده است. اين ذرات به دلیل متفاوت بودن خصوصیاتی همچون اندازه و 
ترکیبات شیمیایی تشکیل دهنده تأثیرات یکسانی بر محبط‌زیست و سلامتی انسان ندارند. ذرات با قطر آثرودینامیکی 
کوچک‌تر از ۱۰ میکرومتر را به‌احتصار ۳۷110 و ذرات با قطر آثرودینامیکی کوچک‌تر از ۲/۵ میکرومتر را به‌احتصار 
5 مى نامند. افزايش غلظت ذرات ۳۷12.5 علاوه بر تهدید سلامت انسان باعث بروز هزینه‌های اقتصادی و تأثیر 
منفی بر حاص‌لخیزی خاک چرخه غذایی» فتوستتز OLS‏ و منابع آبی می‌شود ( Liao et al., 2020; Singer,‏ 
(Zobeck, Poberezsky, & Argaman, 2003‏ بنابراین اندازه‌گیری و پایش میزان غلظت اين ذرات امری ضروری 


است. 


1 Particulate Matter 


سال دوازدهم ارائه یک روش مبتنی بر یادگیری ماشین برای WY .... GAB‏ 


یکی از روش‌های معمول در پایش ذرات ۳۸2.5 اندازه‌گیری میزان غلظت آن‌ها با استفاده از ایستگاه‌های زميق 
کنترل کیفیت هوا است؛ اما ایستگاه‌های زمینی هزینه احداث و نگهداری بالایی دارند. همچنین, به دلیل کم بودن 
تعداد اين ايستكاههاء امکان تخمین دقيق و پایش تغییرات فضایی غلظت اين ذرات خصوصاً در نواحی با تغییرات بالا 
نظیر شهرها ميسن نیست. به‌عنوان یک رامحل؛ از محصولات fol AOD!‏ از مشاهنات ماهواره‌ای برای تخمین این 
آلاینده‌ها استفاده می‌شود. مشاهدات ماهوارهاى علاوه بر پوشش مکانی خوب و پیوستگی زمانی» بسیار مقرون‌به‌صرفه 
هستند )2010 (Anderson et al.,‏ شاخص AOD‏ با تعيين ميزان عمق نورى اتمسفر به‌عنوان یک شاخص مهم در 
مطالعة میزان کیفیت هوا و غاظت ذرات PM2.5‏ مورد استفاده قرار می‌گیرد. AOD‏ شاخصی است که میزان 
جلوگیری از انتشار نور در یک ستون از جو بر اثر حضور ذرات معلق در هوا را اندازه‌گیری می‌کند. بنابراین اين 
شاخص به‌طور مستقيم با میزان غلظت ذرات Ghee‏ در جو ارتباط دارد و به‌عنوان یک شاخص کلیدی در مطالعه 
5 استفاده می‌شود ))2020 (Wei, Chang, Bai, & Gao,‏ مطالعات زیادی جهت تخمین میزان غلظت ذرات 
5 از روی محصولات AOD‏ صورت پذیرفته است ) Bagheri, 2022: Hu et al., 2014; Li, 2020: Ni, Cao,‏ 
(Zhou, Cui, & P Singh, 2018; Qi, Li, Karimian, & Liu, 2019‏ بااین‌حال استفاده از محصولات AOD‏ نيز با 
چالش‌ها و نواقصی همراه است: 

کیفیت داده‌های ورودی خصوصاً داده‌های AOD‏ تأثیر بسیاری در دقت تخمین غلظت PM2.5‏ دارد. در سال‌های 
اخیر الكو ریتم‌های متنوع بازیابی AOD‏ (همچون الكو ریتم‌های SARA? MAIAC? Dark Target Deep Blue‏ ر 
..) توسط تیم‌های تحقیقاتی مختلف گسترش يافتهاند )2012 Hui Xu et al.,‏ الگوریتم‌های مختلف بازیابی AOD‏ 
همیشه خروجی يكسانى از نظر دقت و قدرت تفکیک مکانی نمی‌دهند و در مناطق مختلف عملکردهای متفاوتی 
دارند )2016 (Tang, Bo, & Zhu,‏ به‌عنوان‌مثال» محصول Dark Target (DT)‏ برای مناطقی که بازتاب سطح در 
محدوده مرئی کم است (مانند مناطق دارای پوشش گیاهی) عملکرد بهتری نشان می‌دهد؛ درحالی که محصول Deep‏ 
Blue (DB)‏ در مناطق با سطوح روشن Wh‏ مناطق شهری نتایج دقیق‌تری به دست می‌دهد (:2013 Hsu et al.,‏ 
(Remer, Mattoo, Levy, & Munchak, 2013‏ بااین‌و جود عدم قطعیت‌های زیادی در محصولات فوق وجود دارد 
و این عدم قطعیت‌ها از فرضیات و تقریب‌های زیادی که در مراحل بازیابی AOD‏ ازجمله بخش‌های غربالگری ابر 
انتخاب مدل بازیابی و تعیین بازتاب سطح اتخاذ می‌شود ناشی می‌گردند. بدیهی است که عدم قطعیت در محصولات 


AOD‏ باعث کاهش کیفیت اين محصولات و به‌تبع ol‏ کاهش دقت تخمین PM2.5‏ می‌شود. 


1 Aerosol Optical Depth 
2 Multi Angle Implementation of Atmospheric Correction 
3 Simplified high resolution MODIS Aerosol Retrieval Algorithm 


۱۰۴ جغرافیا و مخاطرات محیطی شمارة سوم 


یکی از روش‌های افزايش کیفیت محصولات مختلف AOD‏ تلفیق آن‌ها است. به‌طورکلی مدل‌های تلفیق داد 
اطلاعات چندین سنجنده را جهت بهبود دقت و دستیابی به اطلاعات poke‏ ترکیب می‌کنند ( ;2013 Castanedo,‏ 
Hall & Llinas, 1997; Khaleghi, Khamis, Karray, & Razavi, 2013; Meng, Jing, Yan, & Pedrycz, 2020;‏ 
(Mirzaei, Bagheri, & Sattari, 3‏ تلفیق اين محصولات منجر به رفع عيوب هر یک و همچنین افزایش 
توانایی‌های بالقوه آن‌ها می‌شود 

.Bagheri, Schmitt, d’ Angelo, & Zhu, 2018; Bagheri, Schmitt, & Zhu, 2018; H Xu et al., 2015)‏ در 
مطالعات گذشته نیز تلاش‌هایی برای بهبود عملکرد محصولات AOD‏ صورت پذیرفته است. به‌عنوان‌مثال» هان و 
همکاران" (۲۰۱۷) محصولات AOD‏ سنجنده‌های 1۷۲0۳62 و 0۸10۳3 را در یک فرآیند دو مرحله‌ای با هم 
تلفیق کردند. در مرحله اول شرایطی که هرکدام از محصولات اين دو سنجنده با کیفیت بهتر عمل می کرد تعيبن شد. 
در مرحله بعد. تلفیق دو محصول براساس نقاط ضعف و قوت آن‌ها انجام شد و دقت به‌طور قابل‌توجهی از ۰.1۵ و 
۲ به ترتیب برای محصول MODIS‏ و CAILOP‏ به ۰۸۰ برای محصول تلفیق شده براساس ۸۶ افزایش يافت 
(Han, Ding, Ma, & Gong, 2017)‏ همچنین وانگ و همکاران* (۲۰۱۹) محصول عمق نوری آئروسل سنجنده 
MODIS‏ از سکوهای Terra‏ و Aqua‏ که با الگوریتم DB‏ تولید شده بودند را برای بهبود پوشش مکانی تلفیق کردند. 
دقت محصول نهایی برابر با دقت محصول MODIS‏ بود و تعداد پیکسل‌های دارای مقدار در محصول تلفیقی ۱۲۳ 
درصد نسبت به محصولات منفرد افزايش یافت. اخيراً در يك مطالعه دیگر به تلفیق محصولات AOD‏ به دست آمده 
از یک سنسور فعال (CALIPSO)‏ و یک سنسور غير فعال (MODIS)‏ پرداخته شد. برای تلفیق اين محصولات از 
روش بيزين ماکزیمم آنتروپی استفاده شد. نتایج بهبود قابل‌توجه پوشش مکانی را نشان داد (پوشش مکانی» برای 
محصولات منفرد در بازة ۰۲ درصد تا ۷۵.٤‏ درصد و برای محصول تلفیقی در OW bL‏ درصد تا ۱۰۰ درصد قرار 
داشت . اين در Sle‏ است که دقت محصول تلفیق شده براساس شاخص RMSE‏ برابر با ۵۰.۲۰ و دقت 
محصولات aol‏ به ترتیب ۰.۱۹ و ۰.۱۸ برای محصولات CALIOP‏ و MODIS‏ بود )2021 (Xia et al.,‏ همچنین 
در مطالعه‌ای در سال ۲۰۲۲ با بهره‌گیری از مزایای شبکه‌های بيزين و رویکرد تلفیق محصولات AOD‏ حاصل از 
سنجنده CALIOP (cls‏ و MODIS‏ سعی در بهبود قدرت تفکیک زمانی محصول عمودی AOD‏ شده است. در 
این تحقیق با بکارگرفتن محصول MAIAC‏ مشاهدات MODIS‏ و محصول عمودی AOD‏ حاصل از CALIOP‏ 


1 Han, Ding, Ma, & Gong, 2017 
2 Moderate Resolution Imaging Spectroradiometer 
3 Cloud-Aerosol Lidar with Orthogonal Polarization 
4 Y. Wang et al., 2019 
بدون واحد است.‎ AOD 0 


سال دوازدهم ارائه یک روش مبتنی بر یادگیری ماشین برای GAB‏ .... 


AOD polis‏ در دو لایه ارتفاعی مجزا با قدرت تفکیک مکانی-زمانی MATAC‏ (به ترتیب یک کبلومتری و روزانه) 
ارائه شد )2022 (Pashayi & Satari,‏ 

علاوه بر کیفیت محصولات AOD‏ الگوریتم مورد استفاده برای تخمین رابطه AOD‏ با داده‌های هواشناسی و 
5 نیز بر دقت تخمین 2012.5 مؤثر است (باقری. ۲۰۲۲). مطالعات زیادی» با استفاده از روش‌های متنوع. جهت 
تخمین میزان غلظت ذرات ۳3۷2.5 از روی محصولات AOD‏ صورت پذیرفته است ( Bagheri, 2022; Hu et al.,‏ 
Li, 2020; Ni et al., 2018: Qi et al., 9‏ :2014). دسته‌ای از اين روش‌ها مبتنی بر یادگیری ماشین می‌باشند که 
در مطالعات متعددى قابليت آن‌ها به اثبات رسيده است 

Bagheri, 2022, 2023; Chen, Yang, Du, & Huang, 2021: Gogikar, Tripathy, Rajagopal, Paul, & ) 


Tyagi, 2021; Hu et al., 2014; Jung, Chen, & Nakayama, 2021; Kianian, Liu, & Chang, 2021; Li, 2020; 
Zhang, 2017; You et al., 2016; Zhao et & ,Ni et al., 2018; Stafoggia et al., 2019; Yang, Yuan, Li, Shen 


(al, 2020‏ نی و همکاران (۲۰۱۸) از یک شکه Fully Connected‏ با یک لايه میانی استفاده کردند و رابطه ميان 
5 محصول DT‏ سنجندة MODIS‏ و داده‌های هواشناسی را تخمين زدند. اين شبکه هفت نورون در AY‏ 
ورودی» هفت نورون در لايه میانی و یک نورون در لايه خروجی داشت. نتایج» 2012.5 را با دقت ۷۸ درصد براساس 
شاخحص R?‏ ارائه کردند. همچنین نبوی و همکاران (۲۰۱۹) از AOD‏ و پارامترهای هواشناسی شامل شش پارامتر 
بیشینه» کمینه و ميانكين دماء زاوية تابش خورشید میزان دید و سرعت باد برای برآورد غلظت ۳۷۲2.5 در تهران 
استفاده كردند. آنها AOD‏ را به کمک ارتفاع لايه تداخل مرزی استاندارد کردند و از الگوریتم درخت تصميم SS‏ 
برای برآورد غلظت PM2.5‏ استفاده كردند. در بهترين حالت. دقت نهايى براساس شاخص R?‏ به ٠.18‏ رسيد (نبوى 
و همکاران؛ ۲۰۱۹). دریک مطالعة دیگر (۲۰۱۹) برای پیش‌بینی PM2.5‏ .به مقايسة عملكرد سه الگوریتم RE‏ 
XGBoost‏ و Fully Connected‏ براساس داده‌های هواشناسی (شامل بیشینه, کمینه و ميانگین دمای dga‏ رطوبت 
نسبیء بارش روزانه» میزان دید. سرعت باد. پایداری سرعت ol‏ فشار هوا و دمای نقطه شبنم) و داده‌های عمق نوری 
آثروسل پرداخته شد كه الگوریتم XGBoost‏ با RMSE‏ برابر ۱۳.۵۸ بهترین عملکرد را از خود نشان داد 
(Zamani Joharestani, Cao, Ni, Bashir, & Talebiesfandarani, 2019)‏ بان و همگاران! (۲۰۲۰) با سه روش 
RF‏ شبکه عصبی و روش XGBoost‏ به تخمین 2012.5 پرداختند. در اين تحقیق» روش XGBoost‏ عملکرد بهتری 
R۶ (‏ برابر 7۶ درصد) نسبت به دو روش دیگر داشت. باقری (۲۰۲۲) با روش Gradient Boosting‏ و به کمک 


محصول MAIAC‏ و داده‌های هواشناسی به تهية نقشه 5 با وضوحبالا در شهر تهران پرداخت. در حين اين 


1 Nabavi et al. 
2 Yan et al. 


۱۰۶ جغرافیا و مخاطرات محبطی شمارة سوم 
تحقيق» به تأثير چندین متغير بر تخمین ۳۷12.5 پرداخته شد. همچنین نشان داده‌شد که الگوریتم یادگیری ماشین 
Gradient Boosting‏ بهترین عملکرد را در ميان ple‏ الگوریتم‌های یادگیری ماشین دارد R*)‏ برابر VEL‏ درصد). 

بررسى مطالعات گذشته نشان می‌دهد که یادگیری ماشین به یک موضوع پرطرفدار تحقیقاتی در حوزه تخمین 
غلظت ذرات 2312.5 از روی داده‌های آثر وسل تبدیل شده است. تنوع الگوریتم‌های استفاده شده در مطالعات قبل؛ 
اهمیت انتخاب الگوریتم يايه برای تلفیق را دو چندان می‌کند. اين مقاله به بررسی تولنایی و دقت الگوریتم‌های 
مختلف در تخمین غلظت ذرات ۳۷12.5 از داده‌های آثروسل ماهواره‌ای و اطلاعات هواشناسی نيز می‌پردازد. در 
نتیجه» يك مدل یادگیری ماشین با بهترین عملکرد. به‌عنوان مدل پایه در تلفیق محصولات مختلف AOD‏ حاصل از 
تصاویر مادیس انتخاب می‌گردد. سيسء تلفیق با استفاده از مدل al‏ و شاخص کیفیت بازیابی محصولات AOD‏ به 
روش میانگین وزن‌دار انجام خواهد شد. اين ايده با کم كردن اثر داده‌های بی‌کیفیت و مشارکت بیشتر داده‌های AOD‏ 
بازيابى شده با دقت بالا در فرآیند تلفیق, منجر به تخمین دقیق‌تر ۳۸12.5 خواهد گردید. به‌طور مشخص هدف اصلی 
اين مطالعه بهبود دقت تخمین 2012.5 از طريق حذف يا کاهش منابع عدم قطعیت موجود در محصولات AOD‏ با 
استفاده از تلفیق آن‌ها است. 


۲- مواد و روش 

۱-۲- منطقه موردمطالعه 

منطقه موردمطالعه شهر تهران. پایتخت ايران الست که دارای ۱۳.۳ میلیون جمعیت ( Habibi, Alesheikh,‏ 
(Mohammadinia, & Sharif, 2017‏ شکل ۱ موقعیت اين منطقه را نشان می‌دهد. اين شهر از ۳۵۳۵ تا ۳۵.۶۸ درجة 
شمالی و از ۵۱.۱۷ تا ۵۱۳۳ درجۀ شرقی گسترش يافته و ۱ کیلومترمربع مساحت دارد. 

۲-۷ داده‌های مورد استفاده 

در اين مطالعه از محصولات AOD‏ سنجندة Deep Blue) MODIS‏ و (Dark Target‏ اندازه‌گیری‌های زمینی 
5 و داده‌های یک مدل جهانی هواشناسی ) (European Centre for Medium-Range Weather Forecasts‏ 
استفاده گردید. نوع و مشخصات داده‌های مورد استفاده برای تخمین ۳3۷2.5 به‌طور خلاصه در جدول ۱ نمایش داده 
شده‌اند. داده‌ها برای یک ib‏ زمانی هفت ساله از ژانویه ۲۰۱۳ تا دسامبر ۲۰۱۹ جمع‌آوری شدند. در ادامه به جزئیات 


هرکدام از داده‌ها اشاره شده‌است. 
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شکل ۱- منطقه موردمطالعه. شهر تهران 


| آندازه گیری cle‏ هوآشناسی | m‏ 
Á‏ ایستگاه های زمینی ۳2.5 © 


محدوده تهران 


لا 


حدول -١‏ داده‌های استفاده شده برای تخمين غلظت PM2.5‏ 


قدرت تفکیک 


٠١ km 


٠١ km 


منبع داده 


ECMWF 


ECMWF 


ECMWF 


توضیح 
محصولات Deep Blue‏ و Dark‏ 
Target‏ 
عرض جغرافيايى ایستگاه‌های 
اندازه‌گیری PM2.5‏ 
طول جغرافيايى ایستگاه‌های 
اندازه‌گیری PM2.5‏ 
دماى نقطه شبنم 
دما 
ارتفاع لايه مرزى 
فشار سطح 
پوشش متراکم گیاهی 
پوشش کم گیاهی 


سرعت باد 


داده 


AOD 


Latitude 


Longitude 


Dewpoint temperature 
(DPT) 
Temperature (T) 
Boundary layer height 
(BLH) 
Surface pressure (SP) 


Leaf area index, high 
vegetation (Lai hv) 


Leaf area index, low 
vegetation (Lai lv) 


Wind speed (WS) 


۱۰۸ جغرافیا و مخاطرات محبطی شمارة سوم 


قدرت تفکیک قدرت تفکیک 0 

زمانی مکانی ar‏ ~ 0 

Wind direction (WD) جهت باد‎ ECMWF ۱۰ km روزانه‎ 

Clear sky direct solar به سطح در شرايط‎ ak مقدار تابش‎ eee iik روزانه‎ 
radiation at surface (Cdir) آسمان صاف‎ 

روزانه BCMWF ‘hin‏ مقدار اشعه فرابفش رسیده به سطح | Downward UV radiation at‏ 

the surface (Uvb) زمین‎ 
Relative humidity (RH) رطوبت نسبی‎ ECMWF km روزانه‎ 
Day of year (DOY) شماره روز سال‎ - - = 


AOD محصولات‎ -۱-۲-۲ 

در این تحقیق از محصولات AOD‏ سنجندة MODIS‏ استفاده شد. اين سنجنده AOD‏ را با الگوریتم‌های s DT‏ 
8 در طول‌موج ۵ نانومتر بازیابی می‌کند. سنجندة MODIS‏ بر روی دو سکوی Terra‏ و Aqua‏ قرار دارد. 
محصولات با قدرت تفکیک زمانی روزانه. Sy pew‏ رایگان در دسترس هستند Ahttps://earthexplorer.usgs.gov)‏ 
در كنار تمام محصولات AOD‏ مورد استفاده. یک نشانگر کیفیت بازیابی (0) نيز ارائه می‌شود. مقادیر 0 از ۰ 
(پایین‌ترین کیفیت) تا ۲ (بالاترین کیفیت) متغیر است. اين مقادیر براساس تعداد پیکسل‌های ورودی برای بازیابی 
AOD‏ نزدیکی به مناطقی با سطح روشن و مقدار خطاى بازیابی» احتصاص داده می‌شوند Dark Target aerosol")‏ 
.(produact user's guid ", 2020‏ 

۲-۲-۲- اندازه‌گیری زمینی PM2.5‏ 

همان‌طور که در شکل ۱ نمایش داده شده است. مقدار متوسط روزانه ۳12.5 در سطح شهر تهران توسط شرکت 
کنترل Cuts‏ هوای تهران" (AQCC)‏ در ۲۱ ایستگاه اندازه‌گیری ارائه می‌شود Ahttps://www.igair.com)‏ 

۳-۲-۲- داده‌های هواشناسی 

مطالعات مختلفی لزوم استفاده از داده‌های هواشناسی در كنار داده AOD‏ برای تخمين غاظت 2.5( را روشن 
ساخته‌اند )2018 (Gupta & Christopher, 2009; Ni et al.,‏ برای تهية داده‌های هواشناسی روزانه از حروجی مدل 
جهانی ECMWF?‏ استفاده شد. اين داده‌ها نسبت به داده‌های هواشناسی زمینی در منطقة موردهطالعه. توزیع بهتری 
دارند .همان‌طور که در جدول ۱ و شکل ۱ مشخص است اين داده‌ها با قدرت تفکیک مکانی ۱۰ کیلومتر و قدرت 
تفکیک زمانی روزانه فراهم شده‌اند. 


1 Air Quality Control Company 
2 European Centre for Medium-Range Weather Forecasts 
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۲ روش تحقيق 

شکل ۲ روند کلی تحقیق را نشان می‌دهد. نخست. پیش پردازش‌ها بر روی داده‌های خام انجام می‌شود. سپس 
عملکرد چندین الگوریتم یادگیری ماشین در تخمین 2012.5 با استفاده از محصولات مختلف بررسی و الگوریتم 
برتر به‌عنوان الگوریتم پایه در تلفیق محصولات AOD‏ استفاده می‌شود و در نهایت» روش پیشنهادی جهت تلفیق 
محصولات AOD‏ ارائه می‌شود. از اين ساختار کلی می‌توان برای تلفیق دیگر محصولات AOD‏ و نيز در موقعیت‌های 
مکانی دیگر بهره برد. 


تلفیق محصولات AOD‏ 


پیش پردازش و مقایسه روش های یادگیری ماشین 
AODupr - m‏ 
+ 


۸40۵ 
+ 


۱ و۸0‎ | AODypr 


۳ عبتن‎ = pn a e 
۱ ها ۳و )مس میانگین گیری‎ Sop پیش‎ 13009 


7 | 
وزن دار‎ | a i 


) ۳۸/4 J XGBoost 


Quos 0 Qmor 


داده های 
هواشناسی 


¦ AOD محصولات‎ 


دده هلى هواشناسي | 


شکل -Y‏ جارجوب پیاده‌سازی شده برای تلفیق محصولات AOD‏ برای تخمین PM2.5‏ 


۱-۳-۲- پیش پردازش محصولات AOD‏ 

مطالعات گذشته نشان داده‌اند برای تعيين صحت AOD‏ اندازه‌گیری شده می‌توان از مقادیر پیکسل‌های اطراف 
استفاده کرد (باقری, ۲۰۲۲). به بیان دیگر اختلاف زياد بين مقادیر اندازه‌گیری شده در یک همسایگی, نشان دهندة 
حضور ابر برف و يا دیگر عوارض مخرب است. در اين مطالعه نيز بهمنظور استخراج AOD‏ در موقعیت هر ایستگاه 
زمینی» از یک ينجرة ۳×۳ استفاده می‌شود و درهر پنجره میانگین AOD polis‏ به‌همراه انحراف معیار آن‌ها محاسبه 
می گردد. جنانجه در هرپنجره انحراف معیار از ۰/۰۲ بیشتر باشد. اندازه‌گیری مذکور غير قابل اطمینان بوده و حذف 
می‌گردد. مقدار نهایی AOD‏ در يك پنجره بر اساس میانگین مقادیر قابل اطمینان (پس از بررسی در شرط مذکور) 
تعیین می گردد. 

نكته مهم دیگر اين است که AOD‏ در یک ستون از جو اندازه‌گیری می‌شود. در حالی که ذرات PM2.5‏ در 
نزديكى سطح حضور دارند. در این خصوص AOD palis‏ قبل از هر يردازشى بايد تصحیح شوند. تسای و 
همکاران' (۲۰۱۱) نشان دادند که اين تصحیح را می‌توان با تقسيم AOD‏ بر ارتفاع لايه تداخل ) Mixing layer‏ 


1 Tsai et al. 


۱۹۰ جغرافیا و مخاطرات محیطی شمارة سوم 


Tsai, Jeng, Chu, Chen, & Chang, 2011: Z. Wang, Chen, Tao, Zhang, همانند رابطه ۱ بدست آورد(‎ (height 


Su, 0‏ ). که در nAOD ol‏ مقدار نرمال شدة AOD‏ است وین[ نيز ارتفاع لايه تداخل را نشان می‌دهد. 
AOD‏ 


nAOD = (\) 


mix 
در اين مطالعه فرض شد که ذرات آثروسل به‌صورت همگن مخلوط شده و از ارتفاع لايه صرف نظر شد. علاوه‎ 
مرزی(31) دارای ارتفاع یکسانی‎ a آثروسل و ارتفاع‎ a براین نبوی و همکاران (۲۰۱۹) نشان دادند که ارتفاع‎ 
.)۲۰۱٩ بالاتر از لایه‌های مملو از آثروسل هستند در نتیجهء ی[ را می‌توان با 81۲ جایگزین کرد (نبوی و همکاران‎ 
نیز ارتفاع‎ Blh و‎ AOD مقدار نرمال شدة‎ nAOD بن؛ راین» معادله ۱ را می‌توان به‌صورت زیر بازنویسی کرد که آن‎ 
لايه مرزی است.‎ 
AOD 


nAOD = — (Y) 
Blh 


۲-۳-۲- پیش پردازش PM2.5‏ 

در ایستگاه‌های کنترل کیفیت هوای شهر تهران از دستگاه TEOM!‏ برای تعیین غلظت ذرات PM2.5‏ استفاده 
می‌شود. اين دستگاه قبل از اندازه‌گیری غلظت ۳۱۷2.5 دمای محبط را تا ۵۰ درجه سانتیگراد بالا می‌برد. اين امر 
باعث می‌شود جرم خحشک 2012.5 به‌عنوان غلظت PM2.5‏ گزارش شود (باقری۲۰۲۲). مطالعات قبلی نشان داده‌اند 
رابطه ميان AOD‏ و ۳۷۲25 تحت تأثير رطوبت هوا است (زانگ و همکاران» ۲۰۱7). در اين تحقیق به کمک 
فرمول ۳ اثر رطوبت بر ۳۷12.5 اعمال می‌گردد که در آن PM PM,‏ تصحیح شده و RH‏ رطوبت نسبی است که بر 
حسب درصد ok‏ می‌شود. 


_ _ RH, -1 
PM, = PMO - رن‎ ۳ 


۳-۳-۲- پیش پردازش داده‌های هواشناسی 

علاوه بر AOD‏ داده‌های هواشناسی نيز در تخمین 2012.5 نقش مهمی را ايفا می‌کنند. در اين مطالعه از داده‌های 
هواشناسی ECMWF‏ استفاده شد. برای تعبین داده‌های هواشناسی در موقعیت ایستگاه‌های ۴12.5 از روش 
درون‌یابی کریجینگ استفاده شد. هایپرپارامترهای اين روش نيز از طریق اعتبار سنجی متقابل " تعيين شد ( Bagheri,‏ 
(Sadeghian, & Sadjadi, 2014‏ جدول ۲ دقت درونیابی و یکسری اطلاعات آماری برای هر پارامتر هواشناسی را 
نشان می‌دهد. 


1 Tapered Element Oscillating Microbalance 
2 Zhang et al. 
3 K-Fold Cross Validation 
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جدول ۲- اطلاعات آماری و دقت درونیابی پارامترهای هواشناسی 

دقت دروزيابى (MAE)‏ كمينه مقدار بيشينه مقدار ميانكين داده هواشناسی 
Blh (m) WY.) 471.۲ ۳۳۹ ۳۹۵۲‏ 

Cdir (4) VYVEYAY ۱۰۳۸ ۱۳۳۸ WANE 

DPT (K) ۳۷/۱۹ YAVA YOYO ۱۳۰ 

T(K) TAV. Yeva TY. 1.1۷ 

Lai_hv ۱/۸۰ ۲۹ ۱۳ “yy 
Lai_lv ۰ + oY 1۸ ۳۹ 
Sp (Pa) ۸۳۳۸۰ A411 VAVYY.Y YEYANE 

Uvb D ۱۳۰۳۹۶ ۱۳۸۳۷۰۱ 71.0 ۸۱ 

WD (R) 0 ۲.۹ - ۲ 1 

WS 5 ۱۷ 1۷۸ 13 ۷ 

RH (%) ۵ ۷۹ Vt ۱ 


۳-۲-:- مقایسه عملکرد روش‌های یادگیری ماشین وانتخاب مدل پایه برای تلفیق 

همانگونه که در فصل مقدمه ذکر گردید. الگوریتم‌های یادگیری ماشینی مختلفی برای تخمین 2812.5 از داده‌های 
AOD‏ مورد استفاده قرار گرفته‌اند كه هرکدام عملکرد متفاوتی را در تحقيقات مختلف بر اساس منطقه موردمطالعه و 
داده‌های ورودی نشان دادهلند؛ بنابراين» در ابتدا لازم است عملکرد چند الگوریتم یادگیری ماشین پرکاربرد. در 
تخمین 2012.5 با استفاده از محصولات AOD‏ مختلف بررسی گردد. هدف از اين کار يافتن دقیق‌ترین الگوریتم 
برای استفاده در تلفیق محصولات AOD‏ می‌باشد. در ادامه شرح مختصری از الگوریتم‌های به کاررفته بیان می‌گردد. 

یکی از الگوریتم‌های ab‏ در تخمین PM2.5‏ مدل رگرسیون خطی جند متغیره می‌باشد که در مطالعات متعددی 
مورد استفاده قرار گرفته است )2016 (Gogikar et al., 2021; Hu et al., 2014; You et al.,‏ . بااين حال الگوریتم‌های 
خطى قادر به حل مسائل غیرخطی پیچیده با ابعاد بالا نیستند. در نتيجه الگوریتم‌های پیشرفته‌تری نظیر الگوریتم 
ركرسيون بردار يشتيبان' (SVR)‏ در حل اين مسائل مورد استفاده قرار می‌گیرند )2021 (Chen et al.,‏ اين الگوریتم 
مسائل تفكيك نايذير در فضایی با ابعاد كم را از طريق یک نگاشت و با بردن به یک فضاى جديد با ابعاد بيشترء با 
استفاده از یک ابرصفحه تفكيك می کند )2011 (Chang & Lin,‏ . علاوه بر الكوريتم ماشين بردار يشتيبان» درخت‌های 
تصمیم. قابليت بالایی را در حل مسائل ركرسيون غیرخطی نشان دادهاند. نسخه پیشرفته‌ای از اين الكوريتمها نظير 
جنگل تصادفی" 0817 در مطالعات بسيارى برای تخمين غلظت 2812.5 از داده‌های AOD‏ مورد استفاده قرار 


1 Support Vector Regression 
2 Random Forest 


۱ جغرافیا و مخاطرات محیطی شمارة سوم 


گرفته‌اند )2019 RF .Jung et al., 2021; Kianian et al., 2021; Stafoggia et al.,‏ با تجميع ' كردن درختان تصميم 
در برابر بیش برازش مقاوم بوده و ضمن شناسايى داده‌های پرت. می‌تواند اهميت متغیرهای ورودی را ارزیابی 
کند(2018 (Xiao, Chang, Geng, & Liu,‏ بااین‌حال با افزايش درختان و پیچیدگی هر درخت. زمان آموزش و 
پیش بینی مدل افزايش می‌یابد. الگوریتم 2661130050 بر مبنای تقویت" درختان تصمیم شکل می‌گيرد. اين الگوریتم در 
برابر بيش از حد یادگیری» مقاوم ات و از پردازش موازی در حين آموزش استفاده می‌کند که باعث بالا رفتن 
سرعت پردازش و دستيابى به دقت بالاتر می گردد )2019 (Zamani Joharestani et al.,‏ همچنین Íp‏ الگوریتم‌های 
یادگیری عمیق. عملکرد بسیار موفقی در حوزه‌های گوناگون نظیر رگرسیون و طبقه بندی نشان داده‌اند ) Zhu etal.,‏ 
0 متداول‌ترین ساختار در حل مسائل رگرسیون با استفاده از داده‌های جدولی» شبکه‌های FC?‏ می‌باشند 
.)Bharath Ramsundar & Reza Bosagh Zadeh, 2018)‏ با اين وجودبه‌طورکلی الگوریتم‌های يادكيرى عميق در 
مواجه با داده‌های جدولی ناهمگون از plo‏ الگوریتم‌های پادگیری ماشین كلاسيك به ویژه روش‌های مبتنی بر 
درختان تصمیم. ضعیف‌تر عمل می‌کنند (میرزایی و همکاران؛ ۲۰۲۳). NODES‏ یک معماری یادگیری عمیق پیشرفته 
است که برای کار با هر نوع داده جدولی و پوشش اين ضعف. طراحی شده است ) & Popov, Morozov,‏ 
(Babenko, 2019‏ 

لازم به ذکر است در این تحقیق و در هر آزمایش» VO‏ درصد داده‌ها به‌عنوان Sala‏ آموزشی" و ۲۵ درصد داده‌ها 
ol pew‏ دادة آزمایشی " به شکل تصادفی, انتخاب شدند. هایپرپارامترها در pled‏ الگوریتم‌ها (بجز روش رگرسیون 
خحطی ^ (Fully connected‏ از طریق روش اعتبار سنجى متقابل با استفاده از داده‌های آموزشی با انتخاب ۵= K‏ 
تعیین شدند. همچنین سه شاخحص 21129 RMSE”‏ و MAE"‏ به‌عنوان شاخص دقت. در ارزیابی نتایح مورد استفاده 
قرار گرفتند. 

۵-۳-۲- تلفیق محصولات AOD‏ 


همان‌طور كه قبلاً بیان گردید هدف اين پژوهش بهبود تخمین ۳۷2.5 از روی تلفیق داده‌های AOD‏ می‌باشد. 
بااین حال» مطالعات قبلی نيز حاکی از عملکرد متفاوت محصولات AOD‏ در مناطق مختلف‌اند ( :2019 Liu et al.,‏ 


1 Aggregate et al. 

2 Boosting 

3 Fully connected 

4 Mirzaei et al. 

5 Neural Oblivious Decision Ensemble 
6 Train 

7 Test 

8 Linear 

9 R-squared 

10 Root Mean Squared Error 
11 Mean Absolute Error 
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(Sayer et al., 2014; ۷۰ Wang, Yuan, Shen, Zheng, & Zhang, 2020‏ علت اين مسئله را می‌توان در فرضیات 
استفاده شده برای بازیابی محصولات AOD‏ جستجو کرد )2016 (Tang et al.,‏ تلفیق محصولات مختلف AOD‏ 
منجر به تولید یک محصول خواهد شد که تمام مناطق عملکرد قابل قبولی در تخمین 5012.5 دارد. 
در اين بخش محصولات AOD‏ بوصورت مستقیم و بدون پیش‌پردازش با یکدیگر تلفیق می‌شوند. روش 
پیشنهادی, ساده بوده و بار محاسباتی کمی دارد. چالش اساسی در اين نوع تلفیق کاهش نسبت سیگنال به نویز به 
دلیل استفاده از داده‌های مختلف و متعدد بودن منابع ex‏ در آنهاست )2017 (Bagheri, Schmitt, & Zhu,‏ مطالعات 
قبلی OLE‏ داده‌اند که فیلتر محصولات AOD‏ با استفاده از نشانگر CS‏ بازیابی (Q)‏ باعث بهبود عملکرد آن‌ها در 
تخمین ۳3۷2.5 می‌شو ند )2019 (Bagheri, 2022: Nabavi, Haimberger, & Abbasi,‏ شکل Y‏ نتایج مطالعة باقری 
(YYY)‏ در حصوص تأثیر اعمال شاخص کیفیت AOD ph jb‏ محصول MAIAC‏ در تخمین 2012.5 را نشان 
می‌دهد )2022 (Bagheri,‏ در اين مطالعه داده‌های AOD‏ بر اساس دو شرط مربوط به کیفیت بازیابی آن‌ها فیلتر 
ees‏ حالت یک فقط شامل شرط ابری نبودن پیکسل مورد نظر و حالت دوم علاوه بر حالت یک شامل ابری و 
برفى نبودن پیکسل‌های مجاور است. همان‌طور که در شکل ۳ مشخص است افزایش احتمال حضور پیکسل‌های 
باکیفیت. باعث افزايش دقت از نظر شاخحص R?‏ می‌گردد. بااین‌حال فیلتر داده‌ها بر اساس اين شاخحص, باعث کاهش 
تعداد نمونه‌ها می‌شسود. در اين تحقیق نيز برای برای جلوگیری از کاهش نسبت سیکنال به نویز و نيز بهبود دقت 
محصول نهایی» از شاخص © برای تلفیق در سطح داده استفاده‌شد. برای اين ey gave‏ از میانگین وزن دار AOD‏ ها 
برای Gab‏ آن‌ها استفاده گردید. در ابتدای فرآیند تلفيق» شاخص احتمال حضور AOD polis‏ با کیفیت AL‏ در 
میانگین گیری AOD‏ (جزئیات در بخش (IVEY‏ به‌عنوان وزن تعبین می‌گردد. اين شاخص, نسبت تعداد پیکسل‌ها 
با بهترین کیفیت (0-۳)) به تعداد کل پیکسل‌ها در يك پنجره سه در سه اطراف هر ایستگاه را بدصورت معادله »٤‏ 


نشان می‌دهد: 
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شکل ۳- تأثير افزايش احتمال حضور AOD‏ های با کیفیت بر اساس شرایط حالت یک و شرایط حالت دو بر 


تخمین 2112.5 (برای حزئیات بیشتر مراحعه كنيد به )2022 ((Bagheri,‏ 


x? ۱ 2 
_ Lis an _f1 if Q;==3 
P(AODpest) = n ۳ else (£) 


که در آن:0 نشان دهندهُ شاخص کیفیت بازیابی برای پیکسل ام در یک ينجرة ۳×۳ است و P(AODpest)‏ 
Sly‏ احتمال حضور پیکسل با کیفیت. در پنجره مذکور می‌باشد که به‌عنوان وزن پیکسل مربوطه در تلفیق AOD‏ 
da‏ مورد استفاده قرار می‌گیرد. 

يس از تعيين وزن‌هاء AOD‏ تلفیق شده از میانگین وزن‌دار AOD‏ های ورودی بر اساس احتمال بدست‌آمده در 
رابطة٤»‏ محاسبه می گردد (رابطه ۵): 


p fusion P(AODPérrq)XAODPerrat -+P(AODRGua)XAODAGua 


(0) 
best P(A0DRJ,,a)+--"+P(A0D3Ê a) 


AO 


كه در آن اندیس‌های Terra‏ و Aqua‏ به نام سکوهای هر محصول اشاره دارد. انديس DT‏ و DB‏ نيز بیانگر 
الگوریتم بازیابی AOD‏ محصول مورد نظر Saal‏ به‌عنوان‌مثال a)‏ 400)م وزن بداست sal‏ برای محصول DT‏ 
سنجنده Terra‏ است يا AODP Fra‏ : بیز ميانكين راعذهاى بداست 5 در 0 5 YXY‏ برای محصول DT‏ سنجنده 


fusion 


Terra‏ | نشان می‌دهد. AOD; ost‏ نيز محصول تفیلق شده با بهترين شرايط كيفى (حاصل از رابطه $( می‌باشد. در 
نهایت AOD‏ تلفیق شده به ol oa‏ داده‌های هواشناسی» برای تخمين 2012.5 مورد استفاده قرار می گیرد: 


سال دوازدهم ارائه یک روش مبتنی بر یادگیری ماشين برای GAB‏ .... ۵ 


بررسى قرار می‌گيرد. 

۱-۳- نتایج مقایسه روش‌های یادگیری ماشین 

در ابتدا توانایی الگوریتم‌های یادگیری ماشین معرفی شده برای تخمین غلظت ۳۷2.5 با استفاده از محصولات 
DB‏ و DT‏ مورد ارزیابی قرار گرفتند. دقت الگوریتم‌ها در تخمين غلظت 5 در جدول ۲ بیان گردیده است. 
عملکرد الگوریتم XGBoost‏ در تخمين 5 با استفاده از محصول MDT‏ در شاخص R?‏ دو > he‏ در شاعص 
٠.1755 RMSE‏ و در شاخص MAE‏ چ ۰.۳۳ بهتر از الگوریتم RF‏ (به‌عنوان بهترین الگوریتم يس از (XGBoost‏ 
بود. البته XGBoost‏ هنكام استفاده از اين محصول؛ در شاخص MAE‏ و در رقابت با الگوریتم FC‏ اختلاف ناچیزی 
در حدود EE‏ ۰.۰۳ داشت. از منظر شاخص‌های دقت So‏ و همچنین پارامترهایی مثل زمان آموزش و سهولت در 
تعیین ابرپارامترها» اولویت با انتخاب الگوریتم XGBoost‏ است. زمانی که از محصول 21108 برای تخمین PM2.5‏ 
استفاده شد XGBoost‏ درشاخص R?‏ دو درصد و در شاحص RMSE‏ چ ۰.۰۷ نسبت به الگوریتم RF‏ بهتر عمل 
نمود. درحالی‌که از نظر شاخص MAE‏ نتایج لندکی ( چ ۰.۰6) بدتر از الگوریتم RF‏ بود. نکتۂ قلبل‌توجه دیگر 
برتری محسوس XGBoost‏ نسبت به روش‌های یادگیری عمیق آزمایش شله oy‏ با وجود موفقیت‌های چشم‌گیر 
این الگوریتم‌ها در زمینه‌های مختلف اين الگوریتم‌ها در مواجه با داده‌های جدولی ناهمگون؛ عملکرد ضعیف‌تری 
نسبت به الگوریتم‌های کلاسیک مانند درختان 

تصمیم تقویت شده با گرادیان ۰ دارند. همچنین تنظیم ابرپارامترها و زمان آموزش در روش XGBoost‏ بسیار 
سریع‌تر از روش‌های یادگیری Gus‏ است )2022 (Shwartz-Ziv & Armon,‏ 


حدول ۳- عملکرد روش‌های ياد گیری ماشین در تخمین ۳۷۲2.5 


ia ای‎ R? MAE 5 RMSE (“4 
محصولات‎ DT DB DT DB DT DB 
XGBoost v ۰۳ ۸۱ ASA ۱۱۰۹ ۱۹۱ 
RF ۰۸ NE ANE ALE VAY ۱۱۸ 
FC 1 Ms ۸۳۸ ۸۷۰ ۱۳۳۸ ۱۹۲ 


1 heterogeneous tabular data 
2 gradient boosted decision trees 
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eee ف‎ MAE (4) RMSE È$ 
محصولات‎ DT DB DT DB DT DB 
NODE 5۰ ۵ ۱۱3۱ ۳۳۸ ۱1۹ Ex) 
SVR ۰ ۸ 21 ۱۶۰ \AAY ۸1 
Linear 5۰ ۹ ۱۱۳۹ ۱۱۸۲ YEW ۱۳۹ 


Gab نتایج‎ -۲-۳ 

محصولات AOD‏ بر اساس روش توضیح داده شده در بخش 0-۲-۲ با هم تلفیق گردیدند. شکل ۶ دقت 

محصول (401تلفيق شده را نسبت به هر یک از محصولات در تخمین ۳۷2.5 نشان می‌دهد. از نظر شاخص R?‏ 
روش پیشنهادی Gal‏ و تخمين غلظت ۷12.5 شش درصد نسبت به محصول MDT‏ و سیزده درصد نسبت به 
MDB‏ دقیق‌تر عمل نمود. همچنین نتایج حاصل از تلفیق از نظر شاخص ES RMSE‏ ۳۲ نسبت به محصول MDT‏ 
و AS‏ ۰۳۹ نسبت به محصول MDB‏ بهبود یافت. عملکرد محصول تلفیقی, از نظر شاخص MAE‏ نیز روش 
پیشنهادی ES‏ ۲.۲۱ بهتر از MDT‏ و چ ٤.٤١‏ بهتر از MDB‏ بود. به‌طورکلی می‌توان چنین نتیجه‌گیری کرد که تلفیق 
به روش پیشنهادی از نظر دقت» نسبت به هرکدام از محصولات بكار رفته بوصورت منفرد در تخمین PM2.5‏ 
عملکرد سيان بهتری دارد. اما به ؛ يل شرط استفاده شده برای حذف داده‌های بی‌کیفیت در اين روش, برخی اطلاعات 


که ممکن است در تخمین 35 مفید واقع شوند از دست می‌روند. 
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شکل -é‏ الف) نتایج تلفیق محصولات بر اساس شاخص R?‏ ب) نتایج تلفیق محصولات بر اساس شاخص 
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۶- بحث و جمع‌بندی 

در اين مطالعه به بررسی تأثير تلفیق محصولات AOD‏ بر بهبود دقت تخمین ۳۷12.5 به‌عنوان یکی از مهم‌ترین 
مخاطرات زیست‌محیطی مخصوصاً در مناطق شهری پرداخته شد. نخست عملکرد الگوریتم‌های مختلف یادگیری 
ماشین در تخمین 2012.5 ارزیابی شد. نتایج» نشان دهندة برتری الگوریتم XGBoost‏ بر روی داده‌های مورد استفاده 
در مقایسه با روش‌های یادگیری عمیق» بود. سپس الگوریتم ۲ به‌عنوان الگوریتم يليه در روش تلفیق 
پیشنهادی استفاده گردید. روش پیشنهادی بر اساس میانگین وزن‌دار مبتنی بر وزن‌های حاصل از شاخحص کیفیت 
بازیابی ارائه شده در محصولات AOD‏ صورت گرفت. روش مذکور با کم كردن تأثير مشارکت AOD‏ های کم 
کیفیت و نیز افزايش تأثير AOD‏ های باکیفیت, باعث بهبود قابل‌توجه از نظر دقت نسبت به محصولات اولیه برای 
تخمین 2012.5 شد که در قسمت نتایج ارائه گردید. 

همچنین جهت نشان دادن عملکرد مدل پیشنهادی نقشه ۳۷62.5 حاصل تلفیق داده‌های مختلف AOD‏ در سطح 
منطقه موردمطالعه برای یک روز ترسیم گردید. برای ترسیم اين نقشه از اندازه‌گیری‌های زمینی ۳۷12.5 و تخمین‌های 
بدست آمده از روش پیشنهادی و روش درونیابی وزن‌دهی معکوس" بر اساس فاصله استفاده شد. شکل ۵ نقشة 
5 روز چهارم تير ماه سال ۱۳۹۵ را نشان می‌دهد. بر اساس ۳2.5 اندازه‌گیری شده توسط ایستگاه‌های زمینی 
در اين روزء شاخص کیفیت هوا" در دسته متوسط " قرار گرفته است. در اين روز تنها ۱۱ ایستگاه از ۲۱ ایستگاه زمینی 
به دلیل مشکلات فی غلظت ۳۷2.5 را ثبت کرده بودند. بر اساس شکل 4 غلظت ۳۷22.5 با استفاده از روش 
پیشنهادی در مناطق مرکزی مناطق تحت پوشش ایستگاه‌های زمینی» بين ۳۱ تا چ ٤٩4‏ تخمین زده‌شده است که با 
AQI‏ اعلام‌شده از سوی شرکت JES‏ کیفیت هوای تهران (بين 27 17 تا چ 4۱) مطابقت دارد. علت اين اختلاف 
اندک را نیز می‌توان در توزیع نامناسب ایستگاه‌های زمینی اندازه‌گیری ۳۷62.5 جستجو کرد. همان‌طور که در شکل 
مشخص است. در منطقه غرب تهران» به دليل حضور کارخانه‌ها و منابع آلودگی و نيز وزش باد از سمت غرب به 
شرقء غلظت ذرات ۳22.5 بالاست. اين در Je‏ است که هيج ایستگاه اندازه‌گیری زمینی در اين منطقه وجود 


ندارد. 


1 Inverse Distance Weighting 
2 Air Quality Control 
3 Moderate 


فلن جغرافیا و مخاطرات محیطی شمارة سوم 


PM2.5 Station 0 

High: 49.5 

PM2.5 estimation | 
values 


شکل ۵- نقشة روزانه ۳۷۲2.5 تهیه‌شده به کمک تلفیق محصولات مختلف AOD‏ 


تقدیر و تشکر 
نويسندكان از سازمان‌هایی که داده‌های خام را به‌صورت رایگان به اشتراک می گذارند از حمله ناسا برای داده‌های 
AOD‏ سنجنده MODIS‏ شركت کنترل كيفيت هواى تهران برای داده‌های زمينى 0012.5 و مركز پیش‌بینی هواشناسی 
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